跳到主要内容

Java 集合类学习 PriorityQueue

在做剑指 Offer 的 29 题遇到了这个 PriorityQueue,下面对这个工具类进行学习

转载自 java-PriorityQueue 理解+实现大小堆

29. 最小的K个数

描述:

给定一个数组,找出其中最小的K个数。例如数组元素是 4,5,1,6,2,7,3,8 这8个数字,则最小的 4 个数字是 1,2,3,4。如果 K>数组的长度,那么返回一个空的数组

示例1:

输入:[4,5,1,6,2,7,3,8],4 

返回值:[1,2,3,4]

题解:

用最大堆保存这k个数,每次只和堆顶比,如果比堆顶小,删除堆顶,新数入堆。

大堆如下:

这里使用大堆单纯只是为了保持由大到小的顺序,到时插入 List 里面的时候可以无需排序,直接让它的顺序是从小到大

import java.util.ArrayList;
import java.util.PriorityQueue;
import java.util.Comparator;


public class Solution {

public ArrayList<Integer> GetLeastNumbers_Solution(int[] input, int k) {
ArrayList<Integer> result = new ArrayList<Integer>();
int length = input.length;
if(k > length || k == 0){
return result;
}

PriorityQueue<Integer> maxHeap = new PriorityQueue<Integer>(k, new Comparator<Integer>() {
@Override
public int compare(Integer o1, Integer o2) {
return o2.compareTo(o1);
}
});

for (int i = 0; i < length; i++) {
if (maxHeap.size() != k) {
maxHeap.offer(input[i]);
} else if (maxHeap.peek() > input[i]) {
Integer temp = maxHeap.poll();
temp = null;
maxHeap.offer(input[i]);
}
}

for (Integer integer : maxHeap) {
result.add(integer);
}

return result;
}
}

什么是 PriorityQueue

PriorityQueue 顾名思义 优先队列。

优先队列的作用是能保证 每次取出的元素都是队列中权值最小的(Java的优先队列每次取最小元素,C++ 的优先队列每次取最大元素)。

这里牵涉到了大小关系,元素大小的评判可以通过元素本身的自然顺序(natural ordering),也可以通过构造时传入的比较器(Comparator)。

// 如下就是一个最大堆
PriorityQueue<Integer> maxHeap = new PriorityQueue<Integer>(k, new Comparator<Integer>() {
@Override
public int compare(Integer o1, Integer o2) {
return o2.compareTo(o1);
}
});

Java中 PriorityQueue 实现了 Queue 接口,不允许放入 null 元素;其通过堆实现,具体说是通过完全二叉树(complete binary tree)实现的小顶堆(任意一个非叶子节点的权值,都不大于其左右子节点的权值),也就意味着可以通过数组来作为 PriorityQueue 的底层实现。

这里的具体细节可以看 《数据结构 堆》 那篇笔记

上图中我们给每个元素按照层序遍历的方式进行了编号,如果你足够细心,会发现父节点和子节点的编号是有联系的,更确切的说父子节点的编号之间有如下关系:

parent(i) = floor((i - 1)/2)
left(i) = 2i + 1
right(i) = 2i + 2

通过上述三个公式,可以轻易计算出某个节点的父节点以及子节点的下标。这也就是为什么可以直接用数组来存储堆的原因。

PriorityQueue 的 peek()element() 操作是常数时间,add(), offer(), 无参数的 remove() 以及 poll() 方法的时间复杂度都是 log(N)log(N)

PriorityQueue 实现大堆小堆

PriorityQueue 实际上是一个堆(不指定 Comparator 时默认为最小堆),通过传入自定义的 Comparator 函数可以实现大顶堆。

PriorityQueue<Integer> priorityQueue=new PriorityQueue<>(); //小顶堆,默认容量为11

PriorityQueue<Integer> priorityQueue1=new PriorityQueue<>(11, new Comparator<Integer>() {
//大顶堆,容量为11
@Override
public int compare(Integer o1, Integer o2) {
return o2-o1;
}
});

add() 和 offer()

add(E e)offer(E e) 的语义相同,都是向优先队列中插入元素,只是 Queue 接口规定二者对插入失败时的处理不同,前者在插入失败时抛出异常,后则则会返回 false。对于 PriorityQueue 这两个方法其实没什么差别。

新加入的元素可能会破坏小顶堆的性质,因此需要进行必要的调整。

//offer(E e)
public boolean offer(E e) {
if (e == null)//不允许放入null元素
throw new NullPointerException();
modCount++;
int i = size;
if (i >= queue.length)
grow(i + 1);//自动扩容

size = i + 1;
if (i == 0)//队列原来为空,这是插入的第一个元素
queue[0] = e;
else
siftUp(i, e);//调整
return true;
}

上述代码中,扩容函数 grow() 类似于 ArrayList 里的 grow() 函数,就是再申请一个更大的数组,并将原数组的元素复制过去,这里不再赘述。

需要注意的是 siftUp(int k, E x) 方法,该方法用于插入元素 x 并维持堆的特性。

//siftUp()
private void siftUp(int k, E x) {
while (k > 0) {
int parent = (k - 1) >>> 1;//parentNo = (nodeNo-1)/2
Object e = queue[parent];
if (comparator.compare(x, (E) e) >= 0)//调用比较器的比较方法
break;
queue[k] = e;
k = parent;
}
queue[k] = x;
}

新加入的元素 x 可能会破坏小顶堆的性质,因此需要进行调整。调整的过程为:从 k 指定的位置开始,将 x 逐层与当前点的 parent 进行比较并交换,直到满足 x >= queue[parent] 为止。

注意这里的比较可以是元素的自然顺序,也可以是依靠比较器的顺序。

element() 和 peek()

element()peek() 的语义完全相同,都是获取但不删除队首元素,也就是队列中权值最小的那个元素,二者唯一的区别是当方法失败时前者抛出异常,后者返回 null

根据小顶堆的性质,堆顶那个元素就是全局最小的那个;由于堆用数组表示,根据下标关系,0下标处的那个元素既是堆顶元素。所以直接返回数组0下标处的那个元素即可。

代码也就非常简洁:

//peek()
public E peek() {
if (size == 0)
return null;
return (E) queue[0];//0下标处的那个元素就是最小的那个
}

remove() 和 poll()

remove()poll() 方法的语义也完全相同,都是获取并删除队首元素,区别是当方法失败时前者抛出异常,后者返回 null。由于删除操作会改变队列的结构,为维护小顶堆的性质,需要进行必要的调整。

代码如下:

public E poll() {
if (size == 0)
return null;
int s = --size;
modCount++;
E result = (E) queue[0];//0下标处的那个元素就是最小的那个
E x = (E) queue[s];
queue[s] = null;
if (s != 0)
siftDown(0, x);//调整
return result;
}

上述代码首先记录 0 下标处的元素,并用最后一个元素替换 0 下标位置的元素,之后调用 siftDown() 方法对堆进行调整,最后返回原来 0 下标处的那个元素(也就是最小的那个元素)。重点是 siftDown(int k, E x) 方法,该方法的作用是从k指定的位置开始,将x逐层向下与当前点的左右孩子中较小的那个交换,直到x小于或等于左右孩子中的任何一个为止。

//siftDown()
private void siftDown(int k, E x) {
int half = size >>> 1;
while (k < half) {
//首先找到左右孩子中较小的那个,记录到c里,并用child记录其下标
int child = (k << 1) + 1;//leftNo = parentNo*2+1
Object c = queue[child];
int right = child + 1;
if (right < size &&
comparator.compare((E) c, (E) queue[right]) > 0)
c = queue[child = right];
if (comparator.compare(x, (E) c) <= 0)
break;
queue[k] = c;//然后用c取代原来的值
k = child;
}
queue[k] = x;
}